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摘 要 : [目的 /意义 ] 我 国 农作物 种 植 历 史 修 久 ,分 析 古 代 农 作物 的 时 间 分 布 与 发 展演 化 情况 对 优化 现代 农业 种 植 结构 具 
有 重要 意义 。[ 方 法 /过 程 ] 提 出 一 套 深入 典籍 文本 内 容 的 农作物 时 间 分 布 及 演化 特征 分 析 方 法 流程 ,主要 包括 语 
料 获 取 与 数字 化 分词 与 实体 关系 抽取 、 时 间 分 布 特征 分 析 、 演 化 特征 分 析 4 部 分 ,并 选取 15 本 史书 中 的 《 食 货 
志 》 文 本 进行 实证 分 析 。[ 结果 /结论 ] 基 于 《 食 货 志 》 文 本 的 分 析 结 果 得 到 历史 学 、 经 济 学 、 文 献 学 等 多 学 科 相 关 
研究 资料 的 佐证 ,验证 了 方法 的 可 行 性 与 有 效 性 ,可 以 为 基于 典籍 文本 的 古代 农作物 时 间 分 布 及 演化 特征 分 析 提 


供 借鉴 。 但 未 来 还 需要 在 提高 自动 化 水 平 、 扩 大 研究 样本 、 细 化 事件 类 型 等 方面 进一步 优化 方法 流程 。 
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SS 农 为 邦 本 ,本 固 邦 宁 。 农 业 是 国民 经 济 发 展 的 重 
要 英 
把 解决 好 “三 农 ' 问 题 作 为 全 党 工作 重 中 之 重 "上 。 我 
国 看 着 悠久 的 农业 种 植 历史 ,大 约 在 一 万 年 前 就 已 经 
开 竹 种 植 谷物 中 。 从 最 初 “ 凡 可 食 之 物 皆 可 植 " 的 “ 百 
谷 > 时 期 ,到 后 来 的 “ 九 谷 "“ 五 谷 "发展 , 再 到 玉米 . 番 
葛 ; 妨 铃 蔓 等 域外 作物 的 大 量 引进 ,我 国 农作物 类 型 和 
种 植 技术 不 断 完善 ,农业 发 展 也 逐步 走向 成 熟 。 从 历 
史 的 角度 分 析 我 国 农作物 的 起 源 与 发 展 ,揭示 农作物 
在 不 同 历 史 时 期 的 种 植 规律 ,对 于 现代 农作物 种 质 次 
源 ( 又 称 遗 传 资 源 ) 收集 与 品种 改良 都 具有 重要 意义 。 
因此 ,研究 人 员 从 农学 .历史 学 .考古 学 .文献 学 等 多 个 
视角 ,依据 考古 发 现 及 史书 .地 方志 等 古代 典籍 文献 ， 
对 农作物 种 植 的 历史 演变 情况 展开 研究 。 

李 成 趾 通过 梳理 史前 到 两 汉 时 期 黄河 流域 小 麦 相 
关 资 料 ,分 析 了 小 麦 种 植 的 时 间 分 布 情况 。 刘 兴 林 站 
通过 调研 各 地 区 考古 文献 的 记录 信息 ,分 析 了 先秦 时 
期 村 .条 . 稻 ,小麦 等 农作物 的 时 间 分 布 特征 。 简 思 敏 


等 中 基于 区 县 地 方志 文献 资料 ,分 析 了 明 清 时 期 福建 
地 区 水 稳 、 茶 叶 等 作物 的 时 间 分 布 规律 。 李 静 “ 以 北 
川 地 区 的 县 志 资 料 为 基础 ,分 析 了 清 至 民国 时 期 该 地 
区 农作物 的 种 植 .传播 和 分 布 变化 情况 。 上 述 研究 主 
要 以 单一 朝代 或 相距 较 近 的 几 个 朝代 为 研究 区 间 ,部 
分 学 者 进一步 在 较 长 的 历史 时 期 内 研究 农作物 的 演化 
脉络 。 朱 割 等 "依据 出 土 文物 .古籍 记载 等 分 析 了 蔚 
麻 作 物 在 中 国 的 起 源 、 分 布 和 栽培 利用 历史 。 周 跃 
中 以 《 汉 书 闪 汉 胜 之 书 ) 等 史书 典籍 为 基础 ,归纳 分 
析 了 从 先秦 到 明 清 时 期 的 农作物 种 类 及 其 演变 情况 。 
彭 景 元 ”基于 《史记 》《 汉 书 》 和 地 方志 等 典籍 资料 ,从 
农业 起 步 ,农业 开发 海外 作物 引进 等 层面 分 析 了 我 国 
闽南 地 区 的 农业 发 展 历程 。 

现 有 研究 主要 以 人 工 解读 的 方式 从 史料 记载 中 推 
演 农作物 演变 情况 ,分 析 结 果 较 为 准确 。 但 这 类 方法 
主要 存在 3 点 不 足 :@ 一 般 要 求 分 析 人 员 同 时 具备 一 
定 的 农学 和 历史 学 知识 , 受 人 员 知 识 结 构 的 影响 较 大 ; 
@ 往 往 只 针对 单一 或 简单 几 种 农作物 展开 分 析 , 较 少 
同时 对 多 类 型 农作物 进行 考量 ;@@ 对 史料 的 通读 和 分 
析 耗 时 耗 力 ,分 析 效率 有 待 提 升 。 而 随 着 数据 挖掘 技 
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术 的 不 断 发 展 与 科学 计量 方法 的 日 益 多 样 化 ,利用 自 
然 语言 处 理 技术 深入 古籍 文本 内 容 进行 知识 挖掘 就 成 
为 有 效 解决 这 些 问题 的 重要 手段 ,其 分 析 结 果 可 与 人 
工 解读 结果 相互 佐证 ,相互 补充 。 基 于 此 ,本文 提出 基 
于 典籍 文本 的 农作物 时 间 分 布 及 演化 特征 分 析 方 法 流 
程 ,一 方面 从 时 间 层 面 上 分 析 我 国 古 代 农 作物 在 不 同 
朝代 和 年 号 阶段 中 的 整体 分 布 情况 (农作物 时 间 分 
布 ) , 男 一 方面 从 演化 层面 上 分 析 我 国 古 代 农 作物 分 布 


| Step1: 语 料 获取 与 数字 化 
。 人 二 条 数据 库 到 和 


Step2: 分 词 与 实体 关系 抽取 


随时 间 推 移 的 演变 规律 ,并 以 《 食 货 志 》 为 例 对 其 可 行 
性 与 有 效 性 进行 验证 。 
2 分析 方法 与 流程 

本 文 提出 一 套 深入 古代 典籍 文本 内 容 的 农作物 时 
间 分 布 及 演化 特征 分 析 方法 流程 ,主要 包括 语 料 获取 
与 数字 化 ,分词 与 实体 关系 抽取 、 时 间 分 布 特征 分 析 、 


演化 特征 分 析 4 部 分 内 容 ,如 图 1 所 示 : 


词 表 数字 化 | 
T 二 | 
辅助 抽取 数字 化 文本 | | 
vy 分 析 对 象 | ， 
语 境 数字 化 | 


2.]> 语 料 获取 与 数字 化 

ye 语 料 获取 与 数字 化 是 分 析 流程 的 第 一 步 ,也 是 后 
与 原文 语 料 两 类 : 词 表 语 料 以 引得 类 文献 为 主 ,其 作用 
是 纳 中 抽取 词汇 底 表 作为 构建 领域 词 表 的 重要 基础 ， 
该 类 文献 多 为 纸 质 资源 ;原文 语 料 即 古籍 原文 全 文 资 
料 ,常见 的 收录 平台 有 中 国 哲 学 书 电子 化 计划 .汉典 古 
籍 .中 国 基本 古籍 库 .中 华 经 典 古籍 库 等 。 各 平台 在 数 
据 收录 方面 各 有 特色 ,获取 语 料 时 应 尽量 选择 数据 准 
确 文献 覆盖 全 面 的 数据 库 作为 语 料 来 源 ,同时 也 要 注 


意 将 多 个 数据 库 语 料 相互 对 照 补充 ,以 保证 原始 语 料 
的 准确 性 与 完整 性 。 


获取 原始 语 料 后 需要 对 其 进行 数字 化 处 理 ,首先 
以 人 工 录入 方式 实现 词 表 语 料 数字 化 ,然后 利用 Py- 
thon\R 等 程序 在 原始 语 料 中 完成 词 表 候选 语 境 的 自动 
生成 ,再 通过 人 工 方式 对 候选 语 境 进 行 修正 ,最终 得 到 
规范 的 语 境 数据 。 经 过 上 述 数 字 化 处 理 后 ,将 获得 的 
词 表 数 据 与 语 境 数据 共同 作为 数字 化 文本 分 析 对 象 。 
2.2 分 词 与 实体 关系 抽取 

分 词 与 实体 关系 抽取 是 分 析 流 程 的 关键 环节 ,其 


人 文本 自动 
> 实体 标注 - 词性 标注 | 苍 局 
9 
©O 作物 -朝代 
© J 分 布 特征 分 析 | 

| 作物 频次 、 ，_ 时 间 序列 _ 作物 演化 | 相关 ”作物 演化 

上 可视化 一 

< 十 分 析 分析 “站 趋势 分 析 [分 析 记 相关 性 分 析 
© 作物 -年 号 
CO Step3, 时 间 分 布 特征 分 析 ed step4 演 化 特征 分 析 


图 1 农作物 时 间 分 布 及 演化 特征 分 析 方 法 流程 


准确 性 直接 影响 分 析 结果 的 有 效 性 。 该 部 分 主要 包括 
文本 自动 分 词 与 词性 标注 .实体 标注 与 抽取 实体 关系 
抽取 、 实 体 规范 4 个 环节 。 
2.2.1 文本 自动 分 词 与 词性 标注 

自动 分 词 技术 已 经 成 为 中 文 信息 处 理 中 最 为 基本 
和 重要 的 研究 内 容 , 现 有 的 自动 分 词 技术 主要 包括 基 
于 规则 的 方法 和 基于 统计 的 方法 。 针 对 古籍 文本 
的 自动 分 词 方 法 也 在 逐步 发 展 和 应 用 ,如 以 反问 最 大 
匹配 算法 为 主 的 多 策略 分 词 算法 、 基 于 条 件 随机 场 
的 自动 分 词 模型 ”等 。 词 性 标注 主要 是 将 语料库 
中 的 词 按 词 性 分 类 ,常用 的 算法 有 最 大 炉 马 尔 可 夫 模 
型 .条件 随 机 场 等 序列 模型 以 及 循环 神经 网 络 等 深度 
学 习 算 法 。 选 择 适 用 的 自动 分 词 与 词性 标注 算法 是 保 
证 分 析 结 果 可 靠 的 重要 前 提 。 
2.2.2 实体 标注 与 抽取 

农作物 时 间 分 布 与 演化 特征 分 析 的 目标 实体 有 两 
类 :作物 实体 与 时 间 实 体 。 首 先 随 机 选取 部 分 语 料 对 
其 中 的 两 类 实体 进行 人 工 标注 ,添加 实体 标签 ,然后 以 
实体 标注 过 的 语 料 作 为 训练 语 料 对 模型 进行 训练 , 利 
用 最 优 模型 对 目标 语 料 进行 实体 自动 识别 与 抽取 。 
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(1) 实 体 标注 。 一 是 作物 实体 标注 。 结 合 词 表 语 
料 与 原文 语 料 确定 作物 实体 词 表 , 将 其 对 应 到 原文 中 
并 添加 作物 标签 ,如 在 原文 作物 实体 词 的 位 置 添加 
“<C> 票 </C > "标签 ,C(erops, 作 物 ) ,作为 后 续 自 动 
抽取 时 的 作物 实体 识别 触发 标记 。 二 是 时 间 实 体 标注 。 
在 词性 标注 的 基础 上 ,结合 原文 语义 ,人 工 对 原文 中 标 
注 有 “ve" 的 时 间 类 词语 进行 判读 ,补充 修正 漏 标 、 错 标 
的 时 间 实 体 , 并 对 时 间 类 名 词 进行 实体 标注 ,标注 形式 
为 在 时 间 表 达 式 的 位 置 添加 ”< T> 绍兴 五 年 <[T>” 
标签 ,T(time, 时 间 ) ,作为 后 续 自 动 抽取 时 的 时 间 实 体 
识别 触发 标记 。 
(2) 实 体 自动 识别 与 抽取 。 实 体 识别 也 称 为 命 
名 实体 识别 ,是 自然 语言 处 理 中 的 一 项 重要 任务 , 实 
体 自 动 识 别 需 要 与 实体 标注 相 结 合 ,才能 达到 较 好 
的 汲 别 效果 。 在 此 用 上 文中 已 经 添加 过 作物 、 时 间 
实体 标签 的 语 料 对 机 器 学 习 模型 进行 训练 ,利用 得 
j 区 最 优 模型 进一步 对 目标 语 料 进行 实体 自动 识别 


2x8 ”实体 关系 抽取 

@ 完 成 上 述 步 又 后 ,基于 实体 在 原文 中 的 语 境 特征 
各 研究 对 象 的 自身 属性 制定 合适 的 抽取 规则 ,利用 Py- 
tliom) Java 等 计算 机 语言 调用 内 置 函数 自动 化 抽取 不 同 
实体 的 关联 数据 。 抽 取 规则 如 下 :首先 以 标签 ”< C > 
作 有 </C > "为 触发 词 定位 原文 中 的 作物 实体 词 , 折 

多 标签 对 应 的 作物 实体 ;分 别 从 作物 实体 的 前 置 与 
后 己 位 置 定位 与 其 字符 距离 最 近 的 两 个 “<T > 时 间 
< 看 > "标签 ,依次 抽取 该 标签 对 应 的 前 后 两 个 时 间 
实 屈 ,抽取 结果 如 表 1 所 示 : 

表 1 实体 关系 抽取 示例 


作物 前 置 时 间 后 置 时 间 
又 “# 彰 者 ;a2， “# 正 月 始 和 ;bl” 
坑 “# 安 帝 永 初 三 年 ;a2， '“# 桓 帝 永 归 元 年 ;bl 
束 “# 是 时 ;al0” “# 建 安 元 年 ;b3” 


表 1 中 a 代表 前 置 距离 ,b 代表 后 置 距离 ,字母 后 
的 数字 表示 该 时 间 实 体 与 对 应 作物 实体 的 字符 距离 ， 
数字 越 大 ,距离 越 大 。 最 后 通过 人 工 方 式 结 合 原文 语 
境 对 实体 关系 进行 校对 ,从 前 置 时 间 与 后 置 时 间 中 遂 
选 出 最 为 相关 的 时 间作 为 与 作物 实体 关联 的 时 间 实 
体 , 最 终 获 得 规范 化 的 实体 关联 关系 。 
2.2.4 实体 规范 

就 文中 主要 研究 对 象 作 物 和 时 间 而 言 ,在 古籍 文 
本 中 农作物 的 类 别 存在 着 异 名 同 指 现象 ,在 时 间 描 述 


上 亦 有 多 种 形式 。 为 保证 分 析 的 准确 性 ,研究 进一步 
对 自动 抽取 的 实体 数据 进行 规范 。 

(1) 作 物 实体 规范 。 对 作物 实体 的 规范 主要 是 结 
合 已 有 研究 "与 实际 数据 对 农作物 名 称 和 类 属 进 
行 统一 、 合 并 等 ,如 将 “ 藏 与“ 豆 ”合并 为 “ 豆 ”, 将 
“ 粳 一 精 一 税 “ 稻 " 统 一 归 为 “ 稳 " 类 。 主 要 合并 类 别 
如 表 2 所 示 


表 2 主要 作物 实体 规范 


原文 作物 类 ”合并 后 ”原文 作物 类 ”合并 后 ”原文 作物 类 ”合并 后 

白 习 粳 麻 

控 春 疙 鸡 头 英 实 

次 春 入 英 葵 

蒙 顶 橘子 权 季 季 

水 南 金桥 称 ES 

赵 坡 温 柑 票 村 
荞 麦 豆 豆 柔 柔 
麦 项 束 束 


(2) 时 间 实 体 规范 。 根 据 原文 文本 中 各 时 间 表 达 
式 对 时 间 描 述 的 显 隐 性 ,本 文 将 所 有 时 间 表 达 式 划分 
为 显 式 时 间 表 达 式 与 隐 式 时 间 表达 式 。 显 式 时 间 表 达 
式 可 以 直接 获得 具体 时 间 , 隐 式 时 间 表 达 式 则 需要 根 
据 具 体 语 境 推测 时 间 。 本 文 结合 语言 学 历史 学 ,文献 
学 等 方面 的 研究 成 果 , 对 显 式 与 隐 式 时 间 表 达 式 的 具 
体 类 型 进行 细 分 ,如 表 3 所 示 : 

表 3 ” 显 式 与 隐 式 时 间 表达 式 类 型 


类 型 示例 
显 式 时 间 表达 式 ”年 号 + 量词 + 年 永 始 二 年 
王公 /帝王 + 量词 + 年 孝文 五 年 
王公 /帝王 即位 型 文帝 即位 
天 干 地 支 型 太宗 丙 申 年 
隐 式 时 间 表达 式 省略 型 ( 仅 有 年 份 ,省 略 年 号 、 〈 绍 内 ) 四 年 
王公 /帝王 等 ) 
指 代 型 (用 "是 “次 "等 代词 指 ”是 岁 ;次 年 
代 时 间 ) 
方向 型 (用 “前 “后 ”等 词 表 示 二 年 后 
时 间 方向 ) 
区 间 型 (在 时 间 轴 上 表示 为 一 明 朝 初 年 至 成 化 年 
个 区 间 ) 间 
模糊 型 (无 明确 起 止 时 间 , 在 时 ”十 年 间 
间 轴 上 无 法 定位 ) 
然后 ,对 时 间 实 体 进 行规 范 , 主 要 包括 如 下 步 又: 


第 一 步 : 对 不 同类 型 的 显 式 与 隐 式 时 间 表 达 式 进 
行规 范 ,规则 如 表 4 所 示 
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凡 《 食 货 志 ) 为 名 [加 有 从 合作 加 刊 


特征 研究 


表 4 时 间 表 达 式 规范 规则 


类 别 规则 


显 式 时 间 表 达 式 ”年 号 + 量词 + 年 


对 照 年 号 年 表 获 得 朝代 与 公元 


王公 /帝王 + 量词 + ”对 照 帝 王 年 表 获得 朝代 ,年 号 与 
年 公元 纪年 


王公 /帝王 即位 型 对 照 帝 王 年 表 获 得 朝代 、 年 号 与 


公元 纪年 (即位 元 年 ) 


天 干 地 支 型 定位 帝王 或 年 号 后 将 天 干 地 支 
换算 为 具体 年 份 ,获得 朝代 、 征 
号 与 公元 纪年 

隐 式 时 间 表 达 式 。 省 略 型 可 湖 原文 语 境 , 补 全 为 显 式 时 间 
表达 式 

前 代理 可 湖 原文 语 卉 , 蔡 换 为 显 式 时 间 

表达 式 

< 方位 型 问 湖 原文 语 境 , 根 据 时 间 跨 度 换 

> 算 为 显 式 时 间 表 达 式 

bad 区 间 型 可 湖 原文 语 境 ,转换 为 起 始 时 间 

~N 的 显 式 时 间 表 达 式 

LK) 

© 模糊 型 4 于 无 法 定位 具体 时 点 ,一般 不 

© 做 分 析 

I 


加 第 一步 ;对 朝代 、 年 号 名 称 进 行规 范 , 如 辽 朝 大 康 


与 咎 康 均 为 辽 道 宗 耶 律 洪 基 的 同期 年 号 的 不 同 版 本 岂 
滩 闪 此 合并 为 辽 - 大 康 。 同 时 ,对 朝代 进行 合并 ,如 
净 \ 西 汉 “ 新 朝 "及 “东汉 "合并 为 “ 汉 朝 "”, 将 "北宋 "” 
“南宋 ”合并 为 “宋朝 ” ,将 “西晋 "“ 东 晋 ”合并 为 “ 亚 
2. 例 时 间 分 布 特征 分 析 
.三 为 了 揭示 农作物 在 不 同 历史 时 期 内 的 受 关注 程度 
与 网 展 状况 ,首先 对 作物 频次 进行 统计 分 析 , 然 后 构建 
作 肠 -朝代 ,作物 -年 号 .作物 -公元 纪年 等 不 同时 间 
维度 上 的 关联 数据 矩阵 , 并 利用 Ucinet、 Gephi、 
Citespace 等 可 视 化 工具 绘制 知识 图 谱 ,结合 节点 属性 
及 网 络 特征 分 析 农 作物 的 时 间 分 布 特征 。 
2.4 演化 特征 分 析 

为 了 更 清晰 地 刻画 农作物 在 时 间 轴 上 的 发 展演 化 
趋势 , 需 对 农作物 频次 的 动态 变化 情况 进行 时 间 序 列 
分 析 与 可 视 化 。 另 外 ,农作物 间 存 在 着 相互 促进 或 相 
互 排斥 的 影响 "7 ,从 历史 角度 分 析 不 同 农作物 是 否 
具有 相似 的 发 展 趋势 ,对 于 探索 农作物 之 间 可 能 的 相 
互 关系 .全面 把 握 我 国 农作物 种 植 结构 发 展 变化 情况 
具有 积极 意义 。 这 一 目标 主要 通过 分 析 农作物 两 两 之 
间 频 次 变化 的 相关 性 实现 ,常见 的 相关 性 分 析 系数 有 
pearson 系数 .kendall 系数 .spearman 系数 等 。 


3 基于 《 食 货 志 》 文 本 的 农作物 时 间 分 布 
及 演化 特征 分 析 
数据 准备 
《 食 货 志 》 是 我 国 古代 纪 传 体 史 书 中 专门 叙述 各 
代 财 政 经 济 制度 、 农 业 生 产 、 手 工业 发 展 实况 等 的 志 
书 , 在 记录 历代 经 济 发 展现 状 与 政策 调整 的 同时 ,也 涵 
盖 了 特定 经 济 背景 下 农作物 发 展 的 重要 信息 和 统计 数 
据 ,是 研究 古代 农业 经 济 发 展 的 重要 知识 来 源 。 因 此 ， 
本 文 以 《 食 货 志 》 文 本 作为 分 析 对 象 。 
首先 选取 《汉学 引得 从 刊 ) 中 的 《 食 货 志 十 五 种 综 
合 引得 》” "(以 下 简称 《引得 》) 为 词 表 语 料 , 对 其 进 
行 数字 化 录入 与 校对 。 同 时 从 “中 国 哲 学 书 电 子 化 计 
划 平 台 ” 与 “汉典 古籍 ”两 个 平台 获取 我 国 古 代 15 本 
史书 中 《 食 货 志 》 部 分 的 原文 文本 (此 处 15 本 史书 包 
括 《 史 记 兴 汉 书 兴 晋 书 兴 魏 书 兴 隋 书 兴 旧 唐 书 兴 新 
唐 书 兴 旧 五 代 史 兴 宋 史 兴 辽 史 兴 金 史 兴 元 史 兴 新 元 
史 兴 明史 兴 清 史 稿 》, 除 4 史记 》 中 以 《 平 准 书 》 记 录 食 
货 信息 外 ,其 余 史 书 均 设 有 《 食 货 志 》) ,相互 对 照 并 结 
合 后 获得 研究 所 需 原文 语 料 。 然 后 利用 Python 程序 对 
《引得 》 词 表 在 原文 语 料 中 的 语 境 进行 自动 抽取 与 人 
工 校对 。 最 终 得 到 数字 化 的 《引得 》 词 表 字 ( 词 ) 数 
13 041 个 ,原文 语 境 数 191 946 条 。 
3.2 模型 选取 与 效果 评价 
3.2.1 模型 选取 

2018 年 谷歌 提出 一 种 基于 自 注 意 力 机 制 ( self-at- 
tention ) 建 模 的 深度 学 习 模 型 BERT ( Bidirectional En- 
coder Representations from Transformers )' "| ,该 模型 舍 
弃 了 传统 神经 语言 模型 的 循环 神经 网 络 结构 ,采用 双 
向 Transformer 网 络 结构 极 大 地 提升 了 模型 的 特征 提取 
能 力 。BERT 模型 可 以 同时 提取 上 下 文 信息 ,使 得 词语 
的 表示 具有 更 为 准确 和 丰富 的 语义 。 应 用 在 具体 任务 
中 ,比如 对 某 特定 领域 语 料 进行 分 词 .词性 标注 2 、 实 
体 识 别 汪 等 任务 时 ,该 模型 都 取得 了 较 好 的 实验 效 
果 ,在 不 同类 型 典籍 语 料 中 的 适用 性 得 到 了 肯定 。 
此 本 文选 择 BERT 模型 对 《 食 货 志 》 原 始 语 料 进行 分 词 
词性 一 体 化 标注 以 及 相关 实体 的 识别 和 抽取 。 
3.2.2 ”效果 评价 

10 折 交 叉 验 证 是 机 器 学 习 中 较为 常用 的 验证 模 
型 有 效 性 的 方法 ,评价 指标 包括 准确 率 P(precision ) 、 
召回 率 R(recall) 和 调和 平均 值 了 (F-Measure ) 2 。 


3.1 


词性 标注 与 实体 识别 的 模型 效果 如 表 5 、 表 6 所 示 : 
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表 5 BERT 模型 在 目标 语 料 上 的 词性 标注 效果 


(单位 /%) 
10 折 编 号 了 R F 
1 90.01 90.2 90.1 
2 90.26 90.58 90.42 
3 90. 03 90.37 90.2 
4 90.25 90.58 90.41 
5 89.9 90. 26 90.08 
6 89.9 90.44 90.17 
生 90.09 90.43 90. 26 
8 90. 17 90.57 90.37 
9 89.92 90.37 90. 14 
10 89. 86 90.29 90. 08 
Average 90. 04 90.41 90. 22 


一 从 表 5 中 可 以 看 出 在 词性 标注 实验 中 ,10 次 交叉 
实验 中 2 号 语 料 效果 最 好 ,P、\R、F 值 略 高 于 其 他 组 实 
验 第 果 , 总 体 上 BERT 模型 的 词性 标注 评价 结果 ,准确 
率直 到 了 90. 04% ,召回 率 达 到 了 90.41% ,F 值 达到 了 
9 人 >% ,证 明了 BERT 模型 用 于 《 食 货 志 ) 语 料 上 词性 


从 表 6 中 可 以 看 出 在 10 次 交叉 验证 结果 中 ,整体 
er gd 
类 ,模型 与 目标 语 料 的 契合 性 较为 理想 。 整 体 上 通 
BERT 模型 实现 《 食 货 志 》i 看 料 的 分 间 词 性 一 es 
以 及 实体 识别 任务 ,10 折 交 叉 验 证 结果 证 明了 模型 在 

目标 语 料 任务 上 的 可 行 性 。 

采用 前 文 所 述 实 体 标注 与 实体 关系 抽取 系列 步 
又 ,从 15 本 《 食 货 志 》 文 本 中 抽取 得 到 2 366 条 作物 - 
朝代 - 年 号 -公元 纪年 关联 数据 ,这 也 是 后 续 进 行 数 
据 统 计 和 作物 时 间 分 布 与 演化 分 析 的 数据 基础 。 
3.3 农作物 时 间 分 布 特征 分 析 
3.3.1 农作物 频次 统计 分 析 

对 规范 化 的 作物 实体 进行 统计 ,按照 频次 高 低 对 
作物 实体 词 进行 排序 。 考 虑 到 不 同 史书 《 食 货 志 》 记 
录 的 详尽 程度 不 同 ,为 了 消除 不 同时 期 文字 记录 水 平 
带 来 的 影响 ,提高 分 析 的 准确 性 与 客观 性 ,本 文 以 相对 
频次 衡量 农作物 发 展 热度 。 相 对 频次 计算 如 公式 (1) 
所 示 : 


全 证 实验 的 有 效 性 。 Ne ee 有 
己 ” 表 6 基于 BERT 模型 的 实体 自动 识别 效果 Pa(C) =ax Tr 公式 (1) 
C) (单位 /9 ) 其 中 六 CC, ) 为 农作物 C, 在 文本 编号 为 "1" 的 《 食 
is R 5 货 志 》 语 料 中 的 频次 ,n 为 样本 总 量 , 取 值 为 15,t 为 按 
GN 1: So a 照 史 书 编纂 时 间 先 后 排列 的 原文 文本 序号 , 取 值 范围 
x, ee es a 相对 频次 。 即 农作物 的 相对 频次 为 该 作物 在 每 部 《 食 
5 89.11 92.7 90.87 货 志 》 文 本 中 的 实际 频次 与 对 应 文本 总 字数 比值 的 和 。 
二 。 ss .36 91.53 人 由 于 农作物 频次 与 文本 字数 之 间 的 数量 差异 使 得 计算 
rz 89 46 .58 01 结果 偏 小 不 易于 解读 ,本 文 将 所 有 结果 统一 乘 以 系数 
8 人 多 本 是 a, 根 据 数据 特征 在 此 取 值 10;。 经 过 计算 得 到 农作物 
的 相对 频次 (以 下 简称 为 频次 ) 排序 ,Top10 统计 结果 
Average 88.98 92. 82 90. 86 如 表 7 所 示 : 
表 7 相对 频次 Top10 作物 
作物 绝对 频次 相对 值 相对 频次 作物 绝对 频次 相对 值 相对 频次 
票 480 0.015 712 村 及 笠 稻 105 0.001 610 161 
谷 324 0.013 310 所 豆 77 0. 001 124 112 
茶 990 0.010 205 1 020 乘 15 0. 000 868 87 
又 146 0.005 012 S01 更 27 0. 000 852 85 
奏 i135 0.002 379 238 棉 13 0.000 176 18 


从 表 7 中 可 以 看 出 ,“ 票 "的 频次 最 高 ,要 明显 高 于 
其 他 农作物 ,“ 票 "类 作物 不 仅 是 古代 中 国 尤 其 是 北方 
地 区 主要 的 粮食 作物 ,还 广泛 渗透 于 中 国 传统 文化 当 
中 。“ 谷 ”与 “ 票 " 的 生长 习性 基本 相同 ,也 是 北方 地 


区 的 重要 粮食 作物 之 一 i 
次 仅 次 于 “ 票 ”"。 排 名 紧 随 其 后 的 是 “ 茶 ” 和 “ 桑 " ,这 两 
种 作物 是 我 国 古 代 重 要 的 经 济 作 物 ,对 我 国 古代 商品 
经 济 的 发 展 发 挥 着 重要 作用 。“ 麦 " 和" 稳 "” 的 频次 也 
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较 高 ,两 者 是 具有 比较 典型 的 地 域 性 特征 的 农作物 ,我 | 和 区 域内 作为 主要 粮食 作物 而 被 种 植 ” 。 本 文 将 重 
国 古代 尤其 隆 唐 以 后 ,“ 北 故 南 稻 "的 局 面 逐 浙 形 | 点 围绕 上 述 几 类 农作物 展开 分 析 。 

成 。“ 豆 “ 杰 ”““ 冬 “ 棉 " 等 农作物 的 相对 频次 明显 | 3.3.2 作物 - 朝代 分 布 特征 分 析 

低 于 主要 的 粮食 作物 和 经 济 作物 ,但 也 是 古代 农作物 本 文选 择 Ucinet 为 可 视 化 分 析 工具 对 作物 - 朝代 
经 济 体系 中 不 可 缺少 的 组 成 部 分 , 豆 类 曾 在 一 定时 期 | 关联 数据 进行 直观 呈现 ,结果 如 图 2 所 示 : 


& 杞 子 


e 和 本 吕 
e 圆 眼 sw 
NAN 
EE | NX 


准 
才 


2 作物 -朝代 关联 


Ou 2 中 国 形 节点 表示 农作物 ,方形 节点 表示 朝代 ， | 的 种 植 业 得 到 了 进一步 发 展 ””。“ 麦 "是 起 源 于 西 
节 冯 与 节点 之 间 的 连 线 表示 农作物 与 朝代 的 关联 关 ” 亚 , 后 传 入 中 国 的 粮食 作物 ”。 从 图 1 中 可 以 看 出 
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系 Yy 连 线 的 粗细 表示 关联 频次 的 大 小 。 “ 麦 ” 与 唐 朝 的 关联 频次 最 高 , 唐 时 麦 类 作物 逐步 上 升 到 
CN 从 农作物 角度 ,“ 粟 "“ 茶 "““ 谷 "““ 麦 "等 与 多 个 朝 | 主流 地 位 ,成 为 北方 最 主要 的 粮食 作物 之 一 。 
f 辆 只 有 较 高 关联 频次 ,说 明 这 些 农作物 在 古代 经 济 从 朝代 角度 , 明 朝 、 金 朝 、 宋 朝 、 元 朝 、 唐 朝 \ 汉 朝 、 


史 改 展 中 发 挥 了 关键 作用 。 “ 票 ”是 我 国 最 早 的 农 作 | 清朝 等 朝代 的 关联 农作物 较 多 且 关 联 频 次 更 高 。 这 些 
一 ,从 春秋 战国 时 期 就 已 经 成 为 经 济 发 展 的 重要 | 朝代 在 历史 上 存在 的 时 间 都 较 长 ,并 且 多 数 所 处 的 时 
组 威 要 素 ,还 是 政府 傣 禄 制度 的 一 部 分 。“ 栗 "在 汉 | 期 是 整个 封建 社会 的 中 后 期 ,可 以 充分 借鉴 前 人 农业 
朝 S 诗 朝 、 辽 朝 、 金 朝 、 元 朝 受 关注 程度 均 较 高 ,其 中 与 发 展 经 验 , 利 农 政策 相对 完善 ,为 农业 经 济 发 展 提供 了 
汉 赫 、 辽 朝 的 关联 关系 最 为 明显 。 汉 朝 晃 错 提出 “ 重 农 | 良好 的 环境 。 为 了 进一步 了 解 不 同 执政 者 统治 时 间 段 
贵 票 "政策 ,促进 了 粟 作 农业 的 发 展 ”: ;过 立国 之 后 便 | 内 的 作物 分 布 情况 ,本 文 将 时 间 实 体 从 朝代 层面 具体 
主张 " 专 事 于 农 ” ,促进 了 以 旱地 粮食 作物 为 主 的 农业 | 到 年 号 层面 进行 分 析 。 
发 展 ,“ 票 ”成 为 种 植 范围 最 广 的 农作物 ””。“ 茶 ” | 3.3.3 作物 -年 号 分 布 特征 分 析 


在 明 朝 宋朝 、 唐 朝 、 清 朝 等 朝代 发 展 较 好 。 从 图 2 中 提取 作物 - 年 号 关系 矩阵 ,利用 Ucinet 软件 绘制 
可 以 看 出 ,“ 茶 ”与 明 朝 的 关联 关系 最 高 ,这 也 受益 于 | 作物 -年 号 关联 网 络 图 谱 ,结果 见 图 3。 
明 朝 改革 贡 共 制度 ,减轻 和 茶 税 ,促进 了 散 叶 茶 的 快速 发 图 3 中 圆 形 节点 为 农作物 ,方形 节点 为 年 号 ,节点 


展 。 唐 中 期 以 后 ,中 国 “茶道 ”大 行 , 宋 承 唐 代 饮 茶 | 间 的 连 线 表 示 作 物 与 年 号 的 关联 关系 , 连 线 的 粗细 表 
之 风 , 茶 类 种 植 日 益 普及 ”。“ 谷 "与 辽 朝 、 汉 朝 , 三 | 示 关 联 频次 大 小 。 为 了 使 网 络 图 谱 更 具 可 读 性 ,调整 
国 、 晋 朝 、 唐 朝 等 朝代 的 关联 频次 较 高 。 甚 中" 谷 " 与 | 可 视 化 图 的 显示 闪 值 为 ”>7”, 即 仅 展示 关联 频次 在 7 
辽 天 的 关联 关系 最 为 明显 ,一 方面 是 因为 辽 朝 统治 者 | 次 以 上 的 关系 。 

攻 视 农耕 , 另 一 方面 是 “ 谷 "” 的 耐 旱 耐 寒 属性 更 适合 逐 从 图 3 中 可 以 看 出 , 隋 朝 与 农作物 "村 “和 谷 “ 姜 ” 
浙 转 冷 的 辽 朝 统治 区 域 ， 。“ 谷 "与 汉 朝 的 关联 频次 | 的 关联 频次 较 高 , 隋 - 开 皇 年 间 隋 文帝 杨坚 推行 系列 
也 较 高 ,这 主要 是 汉 初 时 期 , 重 农 抑 商 政策 的 大 力 推行 ，| 利 农 政策 ,使 得 隋 朝 有 了 ”“ 计 天 下 之 储 积 ,得 供 五 六 十 
提高 了 大 众 的 生产 积极 性 。《 泄 胜 之 书 兴 四 民 月 令 》 的 | 年 "的 繁 万 局面” 。 唐 朝 与 “ 票 “ 茶 ”“ 谷 ”"“ 麦 ” 
编 葵 ,也 说 明 汉 朝 农业 种 植 更 加 科学 有 序 ,“ 谷 ”类 作物 | “ 桑 "“ 称 "等 多 种 农作物 都 有 较 高 的 关联 频次 ,特别 是 
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目 南北 朝 - 神 色 
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南北 朝 - 灰 和 


五 代 十 
E 始 


人 


导 -- 了 


NN 


局 


-天宝 


| 到 


人 
ed 南北 朝 - 怒 和 慎 NS 
- 开 泰 
国 朱 -天 4 pap 本 -类 汉 - 本 始 站 景 福 
清 -雍正 汉 - 建 和 ~ 国 汉 - 初 元 
清 - 2 汉 - 永 初 a 后 元 
二 辽 太 祖 ”图 汉 - 高 帝 刘邦 
晋 - 泰 始 
” 晶 ee 唐 昭 
= 五 代 十 国 - 同 光 
国 日 时 明 -弘治 一 个 Ke rw 
CO 明 辽 -会 同 五 代 十 国 -天 
这 图 3 作物 -年 号 关联 


= 你 基 采取 了 整顿 吏治 .兴修 水 
各 族 革 户籍 等 多 项 举措 ,为 农业 经 济 的 发 展 提供 了 有 
证 ,这 才 有 了 开元 盛世 的 繁华 局 面 人 “i 。 辽 朝 与 
ee 
-统合 . 辽 - 清 宁 、 辽 - 太平 时 期 最 为 突出 。 辽 


“ 豆 ”“ 票 "等 的 关联 频次 较 高 ,其 中 清 -上 康 照 \ 清 -- 乾 
隆 、 清 - 比 正 时 期 与 农作物 的 关联 关系 最 为 明显 。3 
位 旦 帝 采 取 了 误 励 垦荒 放宽 起 科 、 更 民 田 、 摊 丁 人 亩 、 
兴修 水 利 等 措施 ,有 效 刺激 了 农业 生产 ” 。 特 别 是 
耽 隆 星 帝 最 爱 名 钦 茶 ,茶叶 的 种 植 也 在 其 统治 期 间 得 到 


wy 因 俗 而 治 "政策 对 辽 的 农业 发 展 起 到 了 重 

促进 作用 中。 元 朝 与 茶 "“ 票 "“ 桑 "“ 稻 "“ 麦 ” 
“ 弦 等 农作物 都 有 较 高 的 关联 频次 ,特别 是 元 - 至 元 
时 彻 元 世祖 忽 必 烈 重视 农业 发 展 ,从 中 央 到 地 方 建立 
专 全 的 农 司 管理 农业 生产 ,颁布 ( 农 又 辑 要 ) 使 农业 种 
植 铂 加 科学 合理 有 章法 “ 。 清 朝 与 农作物 “ 茶 "“ 谷 ” 


© eo 


了 大 范围 的 推广 '” 
3.4 农作物 演化 特征 分 析 
3.4.1 演化 趋势 分 析 

本 文 进一步 选取 频次 最 高 的 前 8 种 农作物 ,对 其 
沿 时 间 轴 动态 变化 情况 进行 可 视 化 分 析 如 图 4 
所 示 : 
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图 4 中 年 份 为 横 坐标 ,“ 票 “ 谷 “ 茶 “和 桑 “ 麦 " 
“ 稻 “ 豆 “ 谈 "8 种 农作物 自 上 而 下 沿 纵 坐标 轴 平 均 
分 布 ,相对 频次 高 低 以 圆 点 面积 大 小 表示 。 从 整体 来 
看 ,8 种 主要 农作物 在 经 济 发 展 中 开始 受到 重视 的 时 
间 各 不 相同 ,后 续 发 展 态势 及 延续 性 也 呈现 出 不 同 特 
征 。“ 栗 "和 * 谷 "是 较 里 被 人 们 关注 的 两 种 农作物 , 春 
秋 战 国 与 秦汉 时 期 的 饮食 结构 以 谷物 为 主 ,“ 聚 "也 日 
益 占 据 主 导 地 位 ,在 汉代 还 成 为 口粮 的 代称 ”。 而 后 
这 两 种 农作物 迎 来 了 较 长 时 间 的 稳步 发 展 ,一 直到 宋 
金 时 期 都 具有 良好 的 发 展 态势 。 但 到 了 明 清 时 期 ,这 
两 种 农作物 比重 及 地 位 有 所 下 降 , 这 与 “ 麦 “ 豆 "等 农 
作物 比重 提高 以 及 域外 粮食 作物 种 植 范围 扩大 具有 一 
定 的 关联 性 "Y 。 总 体 而 言 ,“ 票 "和 * 谷 "两 种 农作物 在 
其 发 展 过 程 中 具有 较 好 的 延续 性 ,其 发 展 脉络 基本 洱 
尊 癌 我 国 历史 发 展 的 各 个 阶段 ,在 我 国 古代 经 济 社会 
i 局 中 扮演 着 不 可 或 缺 的 重要 角色 。*“ 茶 ”的 流行 开 
婚 末 唐 朝 , 这 一 时 期 种 茶 开 始 从 自然 经 济 下 的 原始 生 
产 爱 展 到 商品 经 济 下 的 社会 生产 ” 。 根 据 陆羽 的 《 茶 
给 记载 , 唐 朝 的 制 茶 ,者 茶 饮 茶 工 具 和 技术 已 经 十 分 

9 。 自 此 茶 业 得 到 快速 发 展 ,“ 茶 "的 发 展 主 要 经 
Se 


2 


其 蓬勃 发 展 态 势 对 近 现 代 茶 业 与 茶 文化 的 进步 与 发 展 
具有 积极 影响 。“ 桑 "大致 兴起 于 春秋 战国 时 期 ,在 
其 发 展 前 期 波动 性 较 大 ,后 又 经 历 了 较 长 时 间 的 平稳 
发 展 阶段 。 但 到 了 明 清 时 期 ,在 桑 业 受到 赋税 制度 改 
革 和 棉花 崛起 的 影响 ,至 清末 趋 于 衰落 。“ 麦 "“ 稻 ” 
“ 豆 ” 和 “ 束 ” 则 在 秦汉 时 期 成 为 人 们 的 主要 粮食 与 水 
果 .干果 ,在 经 历 了 一 段 时 间 的 起 伏 波 动 后 自 唐 宋 
开始 逐步 趋 于 稳定 。 整 体 来 看 “ 桑 “ 麦 ”“ 稻 ” 豆 ” 
和 “ 京 ” 的 发 展 虽 不 及 “ 票 ”“ 谷 "强势 ,但 同样 具有 良好 
的 发 展 态势 和 延续 性 ,因而 也 是 古代 农业 经 济 社会 发 
展 的 重要 推动 元 素 。 
3.4.2 演化 相关 性 分 析 

本 文选 取 频 次 大 于 4 的 农作物 ,对 其 两 两 之 间 的 
频次 变化 情况 做 pearson ,kendall ,spearman 相关 性 分 
析 。 将 分 析 结 果 与 大 量 史 料 对 比 后 发 现 ,pearson 相关 
性 分 析 结 果 更 符合 历史 发 展 实际 ,对 农作物 相互 关系 
的 表征 性 更 强 , 因 此 最 终 选 择 pearson 系数 作为 农作物 
相关 性 分 析 指 标 。 对 分 析 结 果 进 行 数据 可 视 化 ,如 图 
5 所 示 。 图 中 正 相关 用 蓝 色 表示 , 负 相 关 用 红色 表示 ， 
颜色 越 深 表示 相关 性 越 强 。 


栗 谷 茶 又 麦 称 豆 冬 杰 姜 棉 材 橘 种 姜 苹 莲 藉 青 牺 
~ 栗 ox 0.0s ois 0.01! 0.03 0.00 Jol230 oi3 oie oos -0.02 -0.03 0.01 
mm 谷 030 0.07 0.04 0.07 0.13 os2 0.05 0o0.14 -0.04 0.03 -0.04 -0.05 
>< 茶 0.03 0.05 0.15 0.05 0. 13 0.06 0. 11 0.05 -0.01 0.03 $03039 0.12 
人 又 015 0.07 0.05 0.02 -0.01 0.02 -0.01 a 0.06 -0.04 -0.01 -0.02 -0.02 
(= 麦 =0.01 0.04 [oNM50 oo2 0.09 ‘0.21 0W%040 0.02 =0.03 0.13 0.01 -0.03 -=0.03 -0.03 
mn 稳 0.03 0.07 005 -0.01 0.09 0.03 0.00 0.07 -0.03 0.10 0.00 -0.03 -0.03 -0.03 0.14 0.02 
,一 豆 0.00 055 0:13 0.02 [0270 0.03 -0:03 0.16 -0:03 0.00 0.00 -0.02 -0.02 -0.02 -0.02 0.15 
© Eo oo -oo “004 0.00 -0.03 0.02 =0.02 103030 0%030 -0.01 013 -0.01 -0.01 =0.02 
束 "ois 0.05 ‘ol eal 0.02 0.07 0.16 0.02 -0.01 0.14 -0.04 -0.02 -0.02 -0.02 0.19 -0.03 
姜 0.16 014 0.05 -0.01 -0.03 -0.03 -0.03 -0.02 -0.01 0.11 -0.02 0555 | -0.01 -0.01 0.08 -0.01 
棉 0.03 0.06 0.13 0.10 0.00 -0.03 0.14 0.11 -0.04 -0.01 -0.01 -0.01 ‘0.31 -0.02 
材 -0.01 004 0.01 0.00 0.00 -0.03 “004 -0.02 -0.04 -0.01 -0.01 -0.01 -0.02 -0.02 
橘 -0.02 -0.04 oo -oo -0.03 -0.03 -0.02 -0.01 -0.02 elas -oo -oo -0.01 -0.01 -0.01 -0.01 
种 0 0.03 $0303 -0.02 -0.03 -0.03 -0.02 013 -0.02 -0.01 -0.01 -0.01 -0.01 -0.01 -0.01 -0.01 
姜 芋 0.01 030030 0020 =0.01 0;02% -0.01 =0501 =0:01 -0.01 -0.01 -0;01 三 050) 
莲藕 0.13 -0.05 -0.01 0.14 -0.02 -0.01 no 0.08 [os70 -0.02 -ool -0.01 -0.01 -0.01 
青 牺 -004 0.00 0.04 0.12 0.02 015 -0.02 -0:03 -0.01 -0.02 -0.02 -0.01 -0.01 -0.01 -0.01 


5 作物 演化 相关 性 


从 图 5 中 可 以 看 出 ,农作物 发 展 态势 之 间 存 在 正 、 
负 相 关 两 种 关系 ,但 相关 关系 较为 显著 的 几 组 数据 均 
为 正 相关 ,所 有 负 相 关 关 系 都 不 显著 ,这 说 明 这 些 农 作 
物 组 合 之 间 更 可 能 存在 相互 促进 关系 。 相 关 性 最 强 的 
一 组 农作物 为 *“ 桑 - 束 ” ,古代 诗歌 中 “江上 数 株 桑 囊 
树 “ 前 种 桑 麻 后 梨 束 "等 诗句 中 较 好 地 佐证 了 两 者 的 
相关 性 。 这 与 统治 者 的 治国 思路 有 重要 关系 ,特别 是 


在 元 明 时 期 , 包 必 烈 与 朱元璋 都 采取 了 鼓励 百姓 同时 
种 植 桑 束 的 重要 举措 ” 。“ 莲 慕 - 茶 "“ 棉 - 茶 ” 的 
相关 性 也 较 强 ,这 体现 出 “莲藕 "与 “ 茶 "“ 棉 ”与 “ 茶 ” 
的 发 展 历程 较为 类 似 。 具 体 而 言 ， 莲 藉 " 在 唐 时 的 栽 
培 出 现 了 一 个 较为 活跃 和 集中 的 时 期 ,后 在 宋 元 时 期 
不 断 发 展 , 到 明 清 时 期 其 种 植 栽培 .生产 .加工 \ 利 用 等 
各 项 活动 至 于 成 熟 ” ;“ 棉 "在 唐 宋 时 期 在 我 国 边远 地 
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区 的 种 植 态势 良好 ,元 朝 初 年 在 长 江 以 南 得 到 较 大 发 
展 , 明 清 时 代 逐 步 形 成 华北 棉 区 和 华中 棉 区 , 植 棉纺 织 
生产 也 在 全 国 各 地 广泛 发 展 “ 。 除 这 3 组 数据 之 外 ， 
其 他 农作物 组 合 之 间 的 相关 性 都 偏 低 , 相 关 关 系 均 不 
十 分 显著 。 


4 结语 


本 文 提出 了 一 套 完整 的 基于 典籍 文本 的 农作物 时 
间 分 布 及 演化 特征 分 析 方 法 流程 ,根据 典籍 文献 的 语 
言 组 织 特征 ,提出 显 隐 性 时 间 表达 式 的 类 别 划分 和 具 
体 的 规范 方式 ,可 以 为 典籍 文本 挖 气 中 时 间 实体 识别 
与 清洗 提供 参考 ;利用 深度 学 习 模型 BERT 实现 对 原 

台 语 料 的 分 词 词性 一 体 化 标注 ,并 以 添加 入 工 标签 的 
语 料 对 实体 标注 与 实体 关系 自动 抽取 模型 进行 训练 ， 
进 同 实现 对 ( 食 货 志 ) 文 本 相关 实体 的 自动 识别 和 抽 
取 231 以 为 典籍 文本 的 知识 抽取 任务 提供 借鉴 ;融合 时 
闻 避 列 分 析 .知识 图 谱 分 析 等 方法 和 技术 ,实现 了 对 多 
类 农作物 时 间 分 布 及 演化 特征 的 定量 化 与 可 视 化 分 
它 术 以 为 农 史 类 科学 研究 提供 新 思路 。 研 究 将 该 方 
济 信 用 于 《 食 货 志 》 典籍 文 本 ,分 析 结果 得 到 了 历史 
壮阔 济 学 文献 学 等 多 学 科 相 关 研究 资料 的 佐证 ,对 
请 尖 的 可 行 性 与 有 效 性 进行 了 验证 。 本 文 研究 是 在 数 
字 关 文 视角 下 进行 古文 本 情报 挖 据 和 利用 的 一 次 实践 
探索 ,该 方法 流程 可 以 拓展 到 《 汉 胜 之 书 )《 四 民 月 令 》 
(家 可 辑 要 》《 农 书 ) 等 更 多 记录 我 国 古代 农作物 发 展 
情况 的 典籍 文献 研究 中 。 

加 未 来 研究 还 可 以 做 如 下 改进 :中 本 文采 用 的 方法 
流程 自动 化 水 平 有 待 提高 ,后 续 将 训练 更 多 自动 化 模 
型 ,进一步 提升 分 析 效 率 ;加 分 析 可 能 具有 一 定 的 样本 
依赖 性 ,后 续 将 逐步 扩大 研究 样本 ,以 加 强 对 方法 有 效 
性 的 验证 ;四 典籍 文本 中 对 农作物 的 记载 可 能 包括 多 
种 事件 类 型 ,如 农作物 种 植 . 农 作物 加 工农 作物 用 具 
制造 等 ,未 来 研究 可 考虑 进一步 细 分 事件 类 型 ,以 更 加 
全 面 地 分 析 十 代 农 作物 的 多 维特 性 。 还 需要 注意 的 
是 ,这 种 自动 化 分 析 技 术 虽然 提高 了 分 析 效率 , 却 不 能 
完全 取代 传统 的 人 工 解读 方法 ,分 析 时 需 将 两 者 有 效 
结合 ,以 兼顾 分 析 的 准确 性 与 高 效 性 。 
参考 文献 : 

[ 1 ] 新 华 网 ,习近平 出 席 中 央 农 村 工作 会 议 并 发 表 重 要 讲话 [ EB/ 
OL]. [2021 -05 - 15]. http://www. cppee. gov. en/zxww/2020/ 


12/30/ARTI1609288702470104. shtml ,2020-12-30. 
[ 2 ] 陈 明 远 , 金 岷 彬 .历史 考古 的 新 观点 (之 十 ) 甲骨 文中 的 谷类 及 


东西 方 谷物 加 工 技术 的 比较 研究 LJ. 社会 科学 论坛 ,2014 
(10) :16 -35. 

[ 3 ] 李 成 . 黄河 流域 史前 至 两 汉 小 麦 种 植 与 推广 研究 [Dj]. 西安 : 

西北 大 学 ,2014. 

[ 4 ] 刘 兴 林 .先秦 两 汉 农作物 分 布 组 合 的 考古 学 研究 [J]. 考古 学 

报 , 2016 (4) : 465 -494. 

[5 ] 简 思 敏 , 刘 锡 涛 . 福建 明 清 时 期 农作物 的 地 理 分 布 [ 趾 . 福建 

地 理 , 2005(4) : 50 -54. 

[6 ] 李 静 . 清 至 民国 北川 地 区 主要 农作物 的 种 植 及 其 分 布 [中 . 古 

今 农业 , 2009(2) : 77 -83. 

[7 ] 朱 害 , 杨 飞 ,周波 ,等 . 中 国营 麻 的 起 源 、 分 布 与 栽培 利用 史 

[J]. 中 国 农学 通报 , 2014, 30(12 ) : 258 -266. 

[ 8 ] 周 跃 中 . 试 谈 中 国 上 古代 农 作物 种 类 及 其 历史 演变 [J]. 吉林 农 

业 , 2010(8):1-3. 

[ 9 ] 彭 景 元 . 国 南 古代 农业 述 略 [J]. 古今 农业 , 2005(2) : 11 - 

25. 

[10] 黄 水 清 , 王 东 波 , 何 琳 . 以 (汉学 引得 丛刊 》 为 领域 词 表 的 先秦 
典籍 自动 分 词 探讨 [J]. 图 书 情报 工作 ,2015 ,59(11 ) :127 - 
133. 

[11] 印 冰 ,皇甫 娟 . 基于 中 文 信息 处 理 的 古代 汉语 分 词 研究 [ 趾 . 微 

计算 机 信息 ,2008(24) :100 -102. 

[12] 石 民 , 李 斌 , 陈 小 荷 . 基于 CRF 的 先秦 汉语 分 词 标注 一 体 化 研 

究 [ 相 . 中 文 信息 学 报 ,2010 ,24(2) :39 -45. 

[13 ] 王 姗 姗 , 王 东 波 , 黄 水 清 ,等 . 多 维 领域 知识 下 的 《诗经 》 自 动 分 

词 研究 [J] . 情报 学 报 ,2018 ,37(2) :183 - 193. 
涵 .《 说 文 解 字 》“ 食 ”部 字 与 饮食 文化 探究 LJ]. 绵阳 师范 

学 院 学 报 ,2021 ,40(1) :79 -85 ,91. 

《说 文 解 字 》 禾 部 字 看 中 国 古代 的 农业 文化 [J. 黑河 

学 院 学 报 ,2020 ,11(4) :165 -169. 

[16] 张 如 义 , 王 仕 林 , 胡 红 玲 , 等 .3 种 作物 ( 芮 笋 .茄子 .小 白菜 ) 对 
香 樟 凋落 叶 化 感 作用 的 生理 响应 [有]. 热带 亚热带 植物 学 报 ， 
2021 ,29(1) :41 -49. 

[17] RICE 下 工 , 王 天 伦 . 农 作物 的 植物 型 间 生 物化 学 相互 作用 [可 . 
耕作 与 栽培 ,1989(2) :50 -53,55. 

[18] 马 学 良 , 孙 营 . 从 "整理 国 故 " 看 哈佛 燕 京 学 社 汉 学 引得 丛刊 的 
价值 [也 . 图 书 情报 工作 ,2010 ,54(7) :111 - 114. 

[19 ] 马 学 良 , 李 伟 . 哈佛 燕 京 学 社 汉 学 引得 丛刊 的 文献 学 价值 与 思 
想 [中 .河北 大 学 学 报 (哲学 社会 科学 版 ) ,2010,35(2) :94 - 
98. 

[20] DEVLIN J, CHANG M W, LEE K, et al. Bert: pre-training of 


nk 


deep bidirectional transformers for language understanding [J ]. 
arXiv preprint arXiv:1810.04805, 2018. 

[21] 张 琪 ,江川 , 纪 有 书 ,等 . 面向 多 领域 先秦 典籍 的 分 词 词性 一 体 
化 自动 标注 模型 构建 [J]. 数据 分 析 与 知识 发 现 ,2021 ,5 (3) :2 
—11. 

[22] 杜 悦 , 王 东 波 ,江川 ,等 . 数字 人 文 下 的 典籍 深度 学 习 实 体 自动 
识别 模型 构建 及 应 用 研究 [J/OL]. 图 书 情报 工作 :1 -9[2021 


98 


凡 ( 全 计 志 ) 为 名 [中 四 中 从 合作 期 乔 


崔 斌 ， 王 东 波 ， 黄 水 清 . 基于 典籍 文本 的 农作物 时 间 分 布 及 演化 特征 研究 
65(14 ) :90 - 100. 
—04 -09 ]. https://doi. org/10. 13266/j. issn. 0252-3116. 2021 . [44 ] 马 旭 . 开元 盛世 经 济 繁 荣 的 原因 分 析 [ 相 .才智 ,2017 (26 ) : 
03.013 . 203 . 
[23] 关 壮 壮 , 间 学 慧 , 石 嘉 , 等 . 基于 深度 学 习 的 大 豆 豆 蔷 类 别 识别 “| [45] 于 金华 . 简 论 辽 朝 的 “ 因 俗 而 治 " 政 策 [J]. 自贡 师 专 学 报 ,1998 
研究 [站 .作物 学 报 ,2020 ,46(11) :1771 - 1779. (2) :13 -18. 
[24] 陈 永超 .基于 机 器 学 习 的 心音 分 类 算法 研究 [D]. 济南 :山东 | [46] 海 日 . 论 元 世祖 忽 必 烈 的 经 济 政策 [了 .前 沿 ,2009 (5):75 - 
大 学 ,2020. 77. 
[25] 宋 亚 斌 ,开元 军 , 江 腾 宇 ,等 . 基于 距离 相关 系数 和 KNN 回归 模 | [47] 曹 巧 . 论 清朝 前 期 环北 部 湾 地 区 的 农业 垦殖 [可 . 湛江 师范 学 院 
型 的 森林 蓄积 量 估 测 研究 []]. 中 南 林业 科技 大 学 学 报 ,2020， 学 报 ,2011,32(4) :111 -114. 
40(4) :22 -27 ,33. [48 ] 柏林 . 雍正 : 康 蓝 盛世 的 有 力 推 行者 [J. 人 才 资 源 开发 ,2015 
[26] 高 强 . 票 与 粟 文化 [省 . 华夏 文化 ,2003(4) :15 - 17. (3) :103 - 104. 
[27] 周 跃 中 . 试 谈 中 国 十 代 农作物 种 类 及 其 历史 演变 [J]. 吉林 农 、| [49] 肖 婷 . 试 析 农业 发 展 对 * 康 乾 盛 世 "稳固 所 起 的 作用 [J]. 农业 
业 ,2010(8) :1 -3. 考古 ,2012(1) :74 -78 ,106. 
[28] 杨坚 . 古代 大 豆 作为 主食 利用 的 研究 [J]. 古今 农业 ,2000(2) : | [50] 李 幸 哲 , 宋 时 舌 . 落 隆 八 旬 万 寿 庆典 与 清 代 宫廷 茶 文化 一 一 以 
16 -22. 朝鲜 徐 浩 修 《 荡 行 纪 》 为 中 心 [四 . 农业 考古 ,2020(2) :15 -21. 
[29] 同步 克 . 从 稍 食 到 月 修一 战国 秦汉 入 秩 等 级 制 新 探 [] .学术 “| [51] 陈 文 华 . 春秋 战国 ,秦汉 时 期 的 饮食 文化 [J]. 农业 考古 ,2007 
3 界 ,2000(2) :61 -82. (4) :236 -246 ,248 - 249. 
[全 风 汤 标 中 . 文 景 之 治 与 积 迪 贵 聚 [J]. 中 国 粮食 经 济 ,1999(6) :43 ”| [52] 李 秋芳 . 明 清 时 期 华北 平原 粮食 种 植 结构 变迁 研究 [ M]. 北京 : 
ID- 社会 科学 文献 出 版 社 , 2016. 
[3ED 节 钧 . 辽 国 农业 的 发 展 [中 .西南 民族 学 院 学 报 (哲学 社会 科学 [53] 昌 维 新 . 唐 代 茶 叶 生产 发 展 和 演变 [J]. 茶叶 通讯 ,1989(4) :53 
OW) ,1990(3) :80 -84. -54,57. 
[3 二 韩 茂 莉 . 辽 代 农 作物 地 理 分 布 与 种 植 制度 [J]. 中 国 农 中 ,1998 “| [54] 陆羽 , 钟 强 . 茶 经 [ M]. 哈尔滨 :黑龙 江 科 学 技术 出 版 社 , 2012. 
加 :2 -29. [55] 胡 长 春 . 明 清 时 期 中 国 茶 文 化 的 变革 与 发 展 [J]. 农业 考古 ， 
沈 志 荣 . 明代 “ 茶 商 为 神 " 探 究 [了 ]. 杭州 (周刊 ) ,2018 (16) :56 2012(5) :18 -26. 
所 -57. [56] 吴琼 . 秦汉 盘 桑 丝 织 技术 和 早期 丝绸 之 路 []]. 科学 技术 哲学 研 
[办 NWF 升 , 王 思 明 . 评 《中 国 古代 票 作 史 》 一 一 兼 及 作物 史 研究 展 究 ,2015,32(1) :75 -81. 
3 望 []]. 农业 考古 ,2015(6) :341 -343. [57] 马 雪 芹 . 明 清河 南 桑 麻 业 的 兴衰 []]. 中 国 农 中 ,2000(3) :53 - 
L352 晓 雷 . 辽 代 人 饮食 结构 新 探 [J] . 阴山 学 刊 ,2015 ,28 (5) :74 - 56,72. 
Caso. [58] 刘 尊 志 . 秦汉 三 国 时 期 食物 的 品种 []]. 大 众 考古 ,2017 (2) :94 
[3 全 - 陈 冬 仿 . 汉代 农业 生产 的 生态 意蕴 []]. 中 州 学 刊 ,2019 (11 ) : -95. 
C121 - 124. [59」 人 民 教 育 出 版 社 ,课程 教材 研究 所 ,历史 课程 教材 研究 开发 中 
[3 及 3 部 建 新 . 汉代 农业 科技 政策 与 管理 探析 [可 ]. 商丘 师范 学 院 学 心 . 历史 [M] . 北京 :人 民 教育 出 版 社 , 2007. 
报 ,2019,35(5) :75 -79. [60] 张 显 清 . 明太 祖 朱元璋 社会 理想 .治国 方略 及 治国 实践 论 纲 
[38] 赵 志 军 . 小 麦 传人 中 国 的 研究 一 植物 考古 资料 []]. 南方 文 []]. 明史 研究 ,2007:6 -44. 
物 ,2015(3) :44 -52. [61] 章 蓓 蓓 , 丁 晓 蓄 . 中 国 古 代 莲 藕 栽 培 起 源 概 说 [J]. 绿色 科技 ， 
[39] 华 信 辉 《 全 唐诗 》 中 的 唐 代 麦 类 作物 及 其 影响 [J], 三 明 学 院 2015(12 ) :129 - 131， 
学 报 ,2017,34(1) :82 - 85. [62] 史学 通 , 周 谦 . 元 代 的 植 棉 与 纺织 及 其 历史 地 位 [J]. 文史 哲 ， 
[40] 包 艳 杰 , 李 群 . 唐 宋 时 期 华北 冬小麦 主 粮 地 位 的 确立 [J]. 中 国 1983(1) :35 ~45. 
农 史 ,2015 ,34(1):49 - 58. 
[41] 梁 方 仲 . 论 隋 代 经 济 高 涨 的 原因 [J]. 历史 教学 ,1956(12) :10 | 作者 贡献 说 明 : 
0 崔 斌 :数据 处 理 与 论文 撰写 ; 
[人 2] 严 村 明 浅 论 二 代 国富 之 原因 [J] .西北 成 人 教育 学 院 学 报 ， | 王 东 波 ,论文 抱 写 与 修改 指导 ， 
2019(2) :84 -89. Re 
[43] 陈 秀 平 ,欧阳 庆 芳 .隋唐 时 期 农业 立法 及 农业 发 展 状况 浅 析 | 黄 水 清 : 论 文选 题 指导 与 审阅 。 


[站 .法 制 与 社会 ,2009(14) :365 -366. 


99 


图 于 情报 工作 ChinaXiv 合 人 


第 65 卷 第 14 期 2021 年 7 月 


The Analysis of Time Distribution and Evolution Characteristics of Crops in Classics : 
Taking Shihuozhi as an Example 
Cui Bin” Wang Dongbo” Huang Shuiqing 
! College of Information Management, Nanjing Agricultural University, Nanjing 210095 
? Research Center for Humanities and Social Computing, Nanjing Agricultural University, Nanjing 210095 
Abstract: | Purpose/ significance | There is a long history of crop cultivation in China. It is of great significance 
to analyze the time distribution and development evolution of ancient crops for optimizing the modern agricultural 
planting structure. | Method/process | This paper put forward a set of analytical process of crop time distribution 
and evolution characteristics, which included four parts: corpus acquisition and digitization, segmentation and entity 
relationship extraction, time distribution characteristics analysis and evolution characteristics analysis, and selected 
Shihuozhi from 15 historical books for empirical analysis. | Result/conclusion | Based on the analysis results of Shi- 
huozhi, the feasibility and effectiveness of the method are verified by the relevant historical, economic, philological 
‘End other multidisciplinary research data, which can provide reference for the analysis of the time distribution and e- 
Sution characteristics of ancient crops based on classics. But in the future, we need to improve the level of automa- 
Liion, expand the research sample, refine the event type and other aspects to further optimize the method process. 


Keywords: entity association digital humanities Shihuozhi crops visualization 
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